Fechar

1. Identificação
Tipo de ReferênciaTese ou Dissertação (Thesis)
Sitemtc-m21c.sid.inpe.br
Código do Detentorisadg {BR SPINPE} ibi 8JMKD3MGPCW/3DT298S
Identificador8JMKD3MGP3W34R/3RKQRSE
Repositóriosid.inpe.br/mtc-m21c/2018/08.13.13.05
Última Atualização2019:02.14.12.40.32 (UTC) simone
Repositório de Metadadossid.inpe.br/mtc-m21c/2018/08.13.13.05.25
Última Atualização dos Metadados2019:02.15.09.12.41 (UTC) administrator
Chave SecundáriaINPE-18116-TDI/2817
Chave de CitaçãoLotte:2018:StDeRe
Título3-dimensional (3D) urban mapping: a study of detection and reconstruction of building's facade through Structure-from-Motion (SfM) and Convolutional Neural Network (CNN)
Título AlternativoMapeamento urbano tridimensional (3D): um estudo sobre detecção e reconstrução de fachadas de edificações por Estrutura-por-Movimento (SfM) e Redes Neurais Convolutivas (CNN)
CursoSER-SRE-SESPG-INPE-MCTIC-GOV-BR
Ano2018
Data2018-08-24
Data de Acesso27 abr. 2024
Tipo da TeseTese (Doutorado em Sensoriamento Remoto)
Tipo SecundárioTDI
Número de Páginas107
Número de Arquivos1
Tamanho10846 KiB
2. Contextualização
AutorLotte, Rodolfo Georjute
BancaKörting, Thales Sehn (presidente)
Aragão, Luiz Eduardo Oliveira e Cruz de (orientador)
Shimabukuro, Yosio Edemir (orientador)
Wagner, Fabien Hubert
Mitishita, Edson Aparecido
Haala, Norbert
Tommaselli, Antônio Maria Garcia
Endereço de e-Maillotte@dsr.inpe.br
UniversidadeInstituto Nacional de Pesquisas Espaciais (INPE)
CidadeSão José dos Campos
Histórico (UTC)2018-08-13 13:05:25 :: lotte@dsr.inpe.br -> administrator ::
2018-08-14 11:11:43 :: administrator -> pubtc@inpe.br ::
2018-08-14 11:12:19 :: pubtc@inpe.br -> lotte@dsr.inpe.br ::
2018-10-19 19:52:38 :: lotte@dsr.inpe.br -> pubtc@inpe.br ::
2019-01-18 10:59:58 :: pubtc@inpe.br -> administrator ::
2019-02-07 10:43:44 :: administrator -> simone ::
2019-02-14 11:42:06 :: simone :: -> 2018
2019-02-14 11:42:06 :: simone -> administrator :: 2018
2019-02-14 11:42:54 :: administrator -> simone :: 2018
2019-02-14 12:55:42 :: simone -> administrator :: 2018
2019-02-15 09:12:41 :: administrator -> :: 2018
3. Conteúdo e estrutura
É a matriz ou uma cópia?é a matriz
Estágio do Conteúdoconcluido
Transferível1
Palavras-Chave3D urban mapping
facade features
deep-learning
convolutional neural network
structure-from-motion
mapeamento 3D urbano
feições de fachadas
redes neurais convolutivas
ResumoAmbientes urbanos são regiões cuja variabilidade espectral e espacial é extremamente alta, com uma enorme variedade de formas e tamanhos que remetem igualmente ao sensoriamento remoto de alta resolução em aplicações envolvendo seus estudos. Devido ao fato de que esses ambientes podem crescer ainda mais, as aplicações relacionadas ao seu monitoramento em larga escala tendem a recorrer a sistemas autônomos que, juntamente com imagens de alta resolução, podem ajudar e até predizer situações cotidianas. Aliado à detecção inteligente dessas feições, representações 3D desses ambientes têm sido também objeto de estudo ao auxiliar na investigação da qualidade ambiental de áreas muito densas, padrões socioeconômicos de ocupação, na construção de modelos de paisagem urbanos, avaliação de efeitos de ilhas de calor, demolições de edifícios ou simulações de inundações para planos de evacuação e delimitação estratégica, entre inúmeros outros. Por estes aspectos, o objetivo desta pesquisa de doutorado foi explorar as vantagens de tais tecnologias, de forma a apresentar não só uma metodologia automática para detecção e reconstrução de elementos urbanos, como também compreender as dificuldades que ainda cercam o mapeamento automático desses ambientes. Como objetivos específicos: (i) Desenvolver uma rotina de classificação automática de feições de fachadas no domínio 2D, utilizando-se de uma Rede Neural Convolutiva (CNN). (ii) Com as mesmas imagens, obter a geometria da fachada pelas técnicas de Estrutura por Movimento (em inglês, Structure-from-Motion (SfM)) e Estéreo por Multi-Visadas (em inglês, Multi-View Stereo (MVS)). (iii) Avaliar o desempenho do modelo neural para diferentes cenários urbanos e estilos arquitetônicos. (iv) Avaliar o desempenho do modelo neural em uma aplicação real no Brasil, cuja arquitetura diferencia-se dos dados utilizados no treinamento do modelo neural. (v) Classificar o modelo 3D da fachada extraída utilizando-se das imagens segmentadas no domínio 2D pela técnica de Ray-Tracing (RT). Para tanto, a metodologia do trabalho foi dividida em análise 2D (detecção) e 3D (reconstrução). De forma que no primeiro, uma CNN supervisionada é utilizada para segmentar imagens ópticas terrestres de fachadas em seis classes: telhado, janela, parede, porta, sacada e lojas. Simultaneamente, a fachada é reconstruída pelo uso do pipeline SfM/MVS, obtendo-se a geometria da cena. Por fim, os resultados da segmentação no domínio 2D, juntamente com 3D, são então vinculados pela técnica de RT, obtendo-se finalmente o modelo 3D classificado. É demonstrado que a metodologia proposta é robusta em relação a cenários complexos. As inferências realizadas com o modelo neural CNN alcançou até 93% de acurácia, e 90% de F1-score para maioria dos conjuntos de dados utilizados. Para cenários desconhecidos, o modelo neural atingiu índices de acurácia inferiores, justificado pela elevada diferenciação de estilos arquitetônicos. Contudo, a utilização de modelos neurais deep, dão margem à novas configurações e uso conjunto com outras arquiteturas deep para a melhoria dos resultados, sobretudo, aos modelos não-supervisionados. Por fim, o trabalho demonstrou a capacidade autônoma de uma Rede Neural Convolutiva frente a complexidade dos ambientes urbanos, de modo a diversificar entre diferentes estilos de fachadas. Embora haja melhorias a serem realizadas quanto à classificação 3D, a metodologia é consistente e permitiu aliar métodos de última geração na detecção e reconstrução de fachadas, além de fornecer suporte à novos estudos e projeções sobre cenários ainda mais distintos. ABSTRACT: Urban environments are regions in which spectral and spatial variability are extremely high, with a huge range of shapes and sizes, they also demand high resolution images for applications involving their study. These environments can grow over time, applications related to their large-scale monitoring tend to rely on autonomous intelligent systems that, along with high-resolution images, can help and even predict everyday situations. In addition to the detection of these features, 3D representations of these environments have also been object of study to assist in the investigation of the environmental quality of very dense areas, occupational socioeconomic patterns, the construction of urban landscape models, building demolitions or flood simulations for evacuation plans and strategic delimitation, among countless others. The main objective of this study was to explore the advantages of such technologies, in order to present an automatic methodology for the detection and reconstruction of urban elements, and also to understand the difficulties that still surround the automatic mapping of these environments. Specifically we aimed: (i) To develop a routine of automatic classification of facade features in 2D domain, using a Convolutional Neural Network (CNN); (ii) Using the same images, obtain the facade geometry using Structure-from-Motion (SfM) and Multi-View Stereo (MVS) techniques; (iii) Evaluate the performance of the CNN for different urban scenarios and architectural styles; (iv) Evaluate the performance of the CNN in a real application in Brazil, whose architecture differs from the datasets used in the neural model training; and (v) Classify the 3D model of the extracted facade using images segmented in 2D domain by the Ray-Tracing (RT) technique. In order to atempt that, the methodology was splited into 2D analysis (detection) and 3D (reconstruction). So in the first, a supervised CNN is used to segment terrestrial optical images of facades into six classes: roof, window, wall, door, balcony and shops. At the same time, the facade is reconstructed using the SfM/MVS technique, obtaining the geometry of the scene. Finally, the results of segmentation in both domains, 2D and 3D, are then merged by the Ray-Tracing technique, finally obtaining the 3D model classified. It is demonstrated that the proposed methodology is robust toward complex scenarios. The inferences made with the CNN reached up to 93% accuracy, and 90% F1-score for most of the datasets used. For scenarios not used for training, the neural model reached lower accuracy indexes, justified by the high differentiation of architectural styles. However, the use of deep neural models gives chances for new configurations and use with other deep architectures to improve results, especially for unsupervised models. Finally, the work demonstrated the autonomous capacity of a CNN against the complexity of urban environments, in order to diversify between different styles of facades. Although there are improvements to be made regarding 3D classification, the methodology is consistent and allowed to combine state-of-the-art methods in the detection and reconstruction of urban elements, as well as providing support for new studies and projections on even more distinct scenarios.
ÁreaSRE
Arranjourlib.net > BDMCI > Fonds > Produção pgr ATUAIS > SER > 3-dimensional (3D) urban...
Conteúdo da Pasta docacessar
Conteúdo da Pasta source
001-22.pdf 14/02/2019 09:50 779.0 KiB 
@4primeirasPaginas.pdf 14/02/2019 10:39 163.1 KiB 
lotte-thesis-compressed.pdf 14/02/2019 09:50 11.7 MiB
Conteúdo da Pasta agreement
autorizacao.pdf 14/02/2019 09:49 1.1 MiB
4. Condições de acesso e uso
URL dos dadoshttp://urlib.net/ibi/8JMKD3MGP3W34R/3RKQRSE
URL dos dados zipadoshttp://urlib.net/zip/8JMKD3MGP3W34R/3RKQRSE
Idiomaen
Arquivo Alvopublicacao.pdf
Grupo de Usuáriosgabinete@inpe.br
lotte@dsr.inpe.br
pubtc@inpe.br
Visibilidadeshown
Permissão de Leituraallow from all
Permissão de Atualizaçãonão transferida
5. Fontes relacionadas
Repositório Espelhourlib.net/www/2017/11.22.19.04.03
Unidades Imediatamente Superiores8JMKD3MGPCW/3F3NU5S
DivulgaçãoBNDEPOSITOLEGAL
Acervo Hospedeirourlib.net/www/2017/11.22.19.04
6. Notas
Campos Vaziosacademicdepartment affiliation archivingpolicy archivist callnumber contenttype copyholder copyright creatorhistory descriptionlevel doi electronicmailaddress format group isbn issn label lineage mark nextedition notes number orcid parameterlist parentrepositories previousedition previouslowerunit progress readergroup resumeid rightsholder schedulinginformation secondarydate secondarymark session shorttitle sponsor subject tertiarymark tertiarytype url versiontype


Fechar